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基于 Prometheus+Grafana 
实现 新 华 全 媒 新 闻 服 务 平台 统一 运 维 监控 


钟 盔 炯 
( 新 华 社 通信 技术 局 ， 北 京 100803 ) 


摘 要 : 【目的 】 为 实现 新 华 社 供稿 平台 的 统一 运 维 监 控 ， 


基于 Docker 搭建 的 新 华 全 媒 新 闻 服 务 平台 ( 为 新 华 社 供 


稿 平台 ， 以 下 简称 全 媒 平台 ) ， 已 成 为 新 华 社 海内 外 供稿 用 户 的 收 稿 平台 ， 对 平台 运行 情况 的 监控 是 事 关 全 媒 平台 


稳定 安全 运行 的 重要 保障 之 一 。【 方法 】 文章 主要 介绍 
媒 平台 的 系统 监控 方式 方法 。【 结果 ] 本 文 首先 


搭建 


程 ， 实 现 界 面 展 示 和 告警 通知 的 整体 监控 效果 。【 结论 


基于 使 用 开源 工具 Prometheus 和 Grafana， 实 现 基 于 Docker 
全 介绍 了 上 述 两 种 开源 工具 和 Docker 微服 务 部 署 的 技术 要 点 ， 

再 阐述 了 监控 系统 的 技术 架构 ， 从 而 说 明 使 用 这 两 种 工具 搭建 线 上 企业 级 运 维 监控 系统 的 策略 、 实 施 方案 和 实施 过 

】 通 过 基于 Prometheus 和 Grafana 等 开源 框架 ， 搭 建 企 业 级 


新 华 全 媒 新 闻 服 务 平 台 统一 运 维 监控 平台 ， 验 证 了 设计 方案 的 可 行 性 ， 提 升 了 运 维 值班 同志 的 工作 效率 ， 保 证 了 系 

统 的 稳定 性 。 
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导语 

新 华 全 媒 新 闻 服 务 平 台 是 按照 新 华 社 供稿 线路 优 
化 调整 的 总 体 要 求 ， 基 于 云 计 算 和 微服 务 技 术 架 构 ， 
重 构 新 华 社 转 型 发 展 时 期 的 供稿 技术 体系 ， 建 成 包括 
所 有 新 华 社 文字 、 图 片 、 图 表 、 视频 、 新 媒体 、 多 媒体 、 
历史 资料 的 全 媒体 供稿 平台 。Docker 容器 技术 将 作为 
云 计算 领域 的 代表 技术 之 一 ， 以 镜像 方式 交付 ， 以 容 
需 方式 运行 ,使 得 软件 所 依赖 的 环境 与 标准 环境 相同 ， 
只 需要 进行 一 次 构建 ， 即 可 实现 重复 部 署 。 用 微服 务 


用 程序 进行 打包 。Docker 是 一 种 基于 LXC 的 轻 量 级 
虚拟 化 技术 ， 基 于 Go 语言 开发 ， 并 遵循 Apache2.0 协 
议 。 其 主要 目标 是 “Bulid ，Shop and Run Any App， 
Anywhere”。 即 利用 Docker 容器 的 特点 ， 对 资源 进行 
分 割 和 调度 ， 主 要 面向 于 开发 者 与 系统 管理 员 ， 最 终 
实现 一 个 分 布 式 平台 ， 主 要 负责 管理 应 用 组 件 的 整个 
生命 周期 。 使 用 Docker 容器 技术 ， 可 以 对 应 用 进行 高 
效 、 敏 捷 且 自动 化 的 部 署 ， 同 时 结合 操作 系统 内 核 技 
术 (namespaces，cgroups 等 ) ， 为 Docker 容 需 的 安全 


来 重新 定义 架构 体系 已 成 为 业内 系统 设计 和 技术 实现 
的 热门 方向 和 首要 选择 。 

本 文 首 先 对 Docker 、Prometheus 和 Grafana 进行 了 
介绍 ， 然 后 说 明了 基于 Docker 部 署 的 微服 务 架构 全 媒 
平台 ， 提 出 了 其 采用 的 Prometheus+Grafana 实现 企业 
级 系统 监控 的 设计 方案 和 实现 过 程 ， 最 后 展示 了 部 分 
可 视 化 输出 效果 。 
1.Docker 简介 

Docker 是 一 个 被 广泛 使 用 的 开源 容器 引擎 ， 是 
一 种 操作 系统 级 别 的 虚拟 化 技术 ， 它 以 一 种 特殊 进程 
的 方式 运行 于 和 宿主 机 上 ， 它 依赖 于 liunx 内 核 特性 : 
namespace( 名 字 空 间 进行 资源 的 隔离 ) 和 cgroups ( 限 
制 、 记 录 任 务 组 所 使 用 的 物理 资源 ) ， 它 也 可 以 对 应 


与 资源 隔离 提供 了 技术 保障 。™ 
2. Prometheus 与 Grafana 概述 

Prometheus 是 由 SoundCloud 开发 的 开源 监控 报警 
系统 和 时 序列 数据 库 (TSDB ) 。™ 

Prometheus 使 用 Go 语言 开发 ， 是 Google 
BorgMon 监控 系统 的 开源 版 本 。 2016 年 由 Google 发 
起 Linux 基金 会 旗下 的 原生 云 基金 会 (Cloud Native 
Computing Foundation ) ， 将 Prometheus 纳入 其 下 第 
二 大 开源 项 目 。Prometheus 目前 在 开源 社区 相当 活跃。 
Prometheus 和 Heapster ( Heapster ) 是 K8S 的 一 个 子 
项 目 ， 用 于 获取 集群 的 性 能 数据 。 相 比 功 能 更 完善 、 
更 全 面 。Prometheus 性 能 也 足够 支撑 上 万 台 规 模 的 集 
群 部 署 。" 
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Grafana 是 开源 的 、 炫 酶 的 可 视 化 监控 、 分 析 利 器 中 ， 
拥有 快速 灵活 的 客户 端 图 表 和 模块 工具 ， 面 板 插 件 有 许 
多 不 同方 式 的 可 视 化 指标 和 日 志 ， 官 方 库 中 具有 丰富 的 
仪表 盘 插 件 ， 比 如 热 图 、 折 线 图 、 图 表 等 多 种 展示 方式 ， 
让 复杂 的 数据 展示 得 美观 而 优雅 。 支 持 许多 不 同 的 时 间 
序列 数据 库 作 为 其 数据 来 源 的 源头 ， 诸 如 本 文中 提 及 的 
Prometheus。 

3. Prometheus+Grafana 设计 实现 企业 级 系统 运 维 监 
控 

运 维 监控 系统 的 实现 过 程 是 ， 将 基础 平台 和 业务 
系统 中 所 涉及 的 硬件 资源 信息 、 基 础 组 件 信息 、 应 用 
软件 信息 等 统一 纳入 和 运 维 监控 平台 ， 并 进行 指标 的 规 
范 、 收 集 及 统一 集中 存储 。 以 可 用 性 指标 为 基础 ， 逐 
步 增加 服务 质量 相关 指标 。 实 现 系 统 运 维 监控 的 规范 
化 和 故障 告警 处 理 的 智能 化 。 

运行 监控 和 故障 告警 是 运 维 监控 系统 的 两 个 主要 
功能 组 成 部 分 。 根 据 上 述 实 现 思路 ， 统 一 运 维 监控 平 
台 的 实现 架构 设计 如 图 1 所 示 , 划分 为 三 大 组 成 部 分 ， 
分 别 是 数据 采集 、 数 据 提取 (存储) 和 数据 展示 及 报 
警 提 示 。 数 据 采 集 模块 主要 是 部 署 Exporter 等 监控 工 
具 ， 获 取 各 类 基础 数据 ， 当 针对 具体 的 应 用 实现 时 ， 
运 维 人 员 需 要 编写 代码 获取 应 用 的 监控 指标 ， 并 格式 
化 为 Prometheus 的 数据 格式 形式 ; 数据 提取 ( 储存 ) 
主要 是 将 指标 数据 存储 到 Prometheus 时 序数 据 库 中 ， 
主要 用 来 存储 和 查询 监控 的 指标 数据 ; 数据 展示 及 报 
警 提 示 模 式 主 要 是 通过 运用 Grafana 以 及 邮件 、 微 信 
等 外 围 输出 工具 ， 实 现 基础 环境 和 业务 系统 监控 指标 
的 可 视 化 展示 和 告警 信息 的 输出 。 


Node_exporter ST 
TSDB 
RE 展示 端 
HTTP Server 
NN Alertmanager 
被 监控 端 Prometheus Server Alert notify 
图 1 运 维 监控 设计 实现 架构 图 


4. 基于 容器 微服 务 架构 部 署 的 全 媒 平台 系 统 
4.1 微服 务 简介 

微服 务 架构 是 一 种 面向 互联 网 应 用 服务 的 软件 开 
发 架构 中， 主要 应 用 于 互联 网 应 用 服务 的 服务 端 软件 
开发 ， 由 面向 服务 架构 SOA 发 展 而 来 。 微 服务 架构 提 
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倡 将 单 体 架构 应 用 划分 成 一 组 小 的 服务 ， 服 务 之 间 互 
相 协 调 、 互 相配 合 。 
4.2 从 传统 向 微服 务 开发 框架 转移 

笔者 所 在 单位 的 原 有 全 媒 平 台 是 基于 开源 的 
dubbo 框架 设计 搭建 而 成 ， 庞 大 而 复杂 ， 此 架构 对 敏 
捷 开 发 和 迭代 优化 部 署 较为 繁琐 ， 尤 其 是 在 迭代 升级 
和 版 本 回 退 时 较为 困难 。 

本 文中 提 及 的 现 有 全 媒 平台 ， 由 传统 的 服务 架构 
向 基于 Spring Cloud 的 微服 务 架 构 转 移 ， 通 过 调用 本 
地 Consul 客户 端 Consul 服务 器 注册 、 发 现 和 消费 。 向 
Consul 服务 器 注册 时 ， 发 告知 其 卫 和 端口 ， 注 册 后 ， 
会 每 隔 一 定时 间 发 送 健康 检查 ， 当 需要 消费 时 ， 先 去 
Consul 服务 右上 拿 到 一 个 含有 卫 和 端口 的 临时 表 ， 再 
去 Get 实际 的 路 由 。 


图 2 服务 发 现 方式 

4.3 业务 服务 部 署 架构 

为 实现 全 球 站 点 部 署 ， 在 设计 业务 的 服务 架构 中 
充分 考虑 到 业务 的 增 减 和 变更 情况 。 具 体 有 : gateway 
(应 用 服务 路 由 网 关 ) 、doc-view (稿件 查看 ) 、 
doc-server ( 稿件 服务 ) 、auth ( 用 户 认 证 授权 ) 、 
management (后台 资源 管理 ) 、consul server ( 服务 注 
册 与 发 现 ) 和 稿件 入 库 等 .其 业务 部 署 架构 图 如 下 所 示 。 


| 
me oi / \ 
| Sew 
Ca “ED Ce 


图 3 业务 服务 部 署 架构 图 


4.4 容器 化 部 署 实施 

在 上 述 对 各 个 微服 务 模块 进行 细 分 的 前 提 下 ， 实 
现 服 务 模 块 化 打包 、 持 续集 成 持续 交付 ( CVCD ) 的 自 
动 化 运 维 服务 能 力 。 在 此 ， 笔 者 项 目 组 使 用 Docker， 
方便 地 以 “容器 化 ”的 方式 去 部 署 应 用 服务 ， 它 在 镜 
像 中 打包 了 所 有 应 用 所 需要 的 环境 , 正 所 谓 一 次 构建 ， 
处 处 运行 。 为 了 方便 对 Docker 容器 进行 规模 化 和 集群 
化 管理 ， 谷 歌 公 司 推出 的 Kubernetes ( 简称 K8s ) 的 容 
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何 集 群 管理 系统 。Kubernetes 主要 包括 容 帮 集群 的 自 
动 化 部 署 、 自 动 扩 缩 容 、 容 带 维 护 管理 等 功能 模块 。 
在 该 项 目 中 ,使 用 kK8s 对 各 个 应 用 Docker 容 需 进行 
统一 的 管理 ， 根 据 业 务 所 需 和 访问 情况 动态 扩充 ， 以 
保证 系统 服务 的 稳定 性 、 安 全 性 和 可 靠 性 。 

5. 搭建 服务 于 全 媒 平台 的 企业 级 运 维 监控 平台 

5.1 功能 架构 


是 | | ws | | | 

JIE= | | 和 分 组 去 重 

集 | | 用 晤 百 | 告警 通知 
指标 存储 

指标 去 重 保留 期 限 控制 支持 长 期 存储 

到 | | 2 新 供稿 应用 软件 


图 4 统一 运 维 监 控 平 台 功 能 架构 图 


平台 主要 分 为 指标 数据 采集 、 指 标 存储 、 可 视 化 
展现 、 告 警 管理 4 个 主要 功能 模块 。 指 标 采集 模块 负 
责 对 所 有 的 指标 接口 进行 数据 采集 ， 并 将 采集 到 的 时 
序 指标 数据 存 人 指标 存储 时 序数 据 库 中 进行 长 期 存储 ， 
可 视 化 展现 模块 利用 这 些 时 序数 据 进 行 指标 的 各 种 展 
现形 式 的 可 视 化 呈现 ,告警 管理 模块 则 根据 告警 规则 ， 
结合 时 序数 据 进行 规则 匹配 ， 若 触发 规则 ， 则 在 分 组 
去 重 后 进行 告警 通知 。 

5.2 技术 架构 及 实现 


lanxin-gateway APP Push exporter | 
API gateway 1 
| Alertmanager prometheus | | 
Client | | 
Grafana API | | | 
| vmalert ! | vmagent | 


VictoriaMetrics 


Container Runtime 
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服务 ,所 以 更 方便 各 二 级 抓 取 负责 人 员 进 行 调试 .更 新 、 
维护 。 

Grafana ( 详情 请 见 本 文 3 中 简 述 ) 。 

查询 分 析 时 序数 据 库 中 的 时 序数 据 然后 进行 可 视 
化 展示 。 

VictoriaMetrics 

VictoriaMetrics 套件 中 的 指标 集中 存储 组 件 ， 是 一 
个 支持 高 可 用 、 消 耗 低 、 可 伸缩 的 时 序数 据 库 ， 用 于 
Prometheus 标准 时 序 指标 数据 的 长 期 存储 。 

vmagent 

VictoriaMetrics 套件 中 的 指标 采集 组 件 ， 可 以 比 
Prometheus 更 高 效 、 资 源 占 用 更 低 的 采集 海量 时 序 指 
标 数 据 。 

vmalert 

VictoriaMetrics 套件 中 的 告警 指示 组 件 ， 其 执行 一 
系列 给 定 的 rule ( 基于 MetricsQL，PromQL 的 超 集 ) ， 
然后 发 送 告警 信息 到 Alertmanager 组 件 。 

Alertmanager 

告警 通知 组 件 。 其 接收 vmalert 发 送 的 告警 信息 ， 
并 通过 各 种 告警 通知 渠道 发 送 告警 信息 。 可 以 做 到 告 
和 警 信息 进行 去 重 ， 降 品 ， 分 组 ， 策 略 路 由 。 

lanxin—gateway 

蓝 信 消息 网 关 组 件 。 接 收 Alertmanager 发 送 的 告 
和 警 信息 ， 进 行 预 处 理 和 格式 转换 后 通过 调用 蓝 信 和 群 消 
息 接 口 将 告警 消息 发 往 相应 蓝 信 告警 群 。 
5.3 ”部署 架构 

图 6 为 运 维 监 控 平 台 部 署 架 构 示 意图 ， 计 划 在 全 球 
四 大 供稿 站 点 和 北京 总 社 部 署 一 台 或 者 多 台 服 务 器 ， 用 
于 部 署 相应 监控 组 件 的 服务 。 具 体 从 功能 上 分 为 在 4 个 
应 用 服务 站 点 部 署 二 级 抓 取 服务 器 ， 收 集 本 站 点 的 监控 
言 息 ， 统 一 收集 后 ， 发 送 至 总 社 统一 汇总 统一 管理 ; 在 
北京 总 社 部 署 集 中 指标 收集 服务 顺和 核心 服务 需 。 


(Cm ) (ee! Am | 
A 扩 
ee 
于 SS 


图 5 运 维 监控 设计 实现 架构 图 


平台 依托 于 开源 技术 、 产 品 与 自主 研发 的 相关 模 
块 构建 。 底 层 依托 容器 环境 运行 。 

主要 开源 技术 、 产 品 的 选 型 介绍 如 下 : 

Prometheus ( 详情 请 见 本 文 3 中 简 述 ) 。 

在 本 系统 中 作为 二 级 抓 取 服务 ， 由 于 具有 Web UI 


太 AHN 


1 > 
| ass | | ma | | wm | | 


图 6 运 维 监控 部 署 架构 图 
5.3.1 ”核心 服务 层 
图 6 从 上 向 下 看 ,最 上 一 层 为 核心 服务 层 。 主 要 
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责 时 序数 据 的 存储 ， 同 时 有 告警 规则 运算 服务 alert 
责 告警 规则 的 匹配 运算 ， 告 警 服务 Alertmanager 负 
告警 消息 分 组 去 重 及 分 发 ， 可 视 化 展示 服务 Grafana 
提供 指标 展示 。 具 体 就 是 接收 数据 收集 层 发 来 的 格式 
化 规范 化 的 数据 ， 进 行 分 析 筛 选 ， 统 一 存储 至 时 序数 
据 库 中 ，Grafana 调用 时 序数 据 库 中 的 各 类 数据 ， 选 用 
合适 的 展示 模板 供用 户 查 看 ， 同 时 根据 业务 需要 和 业 
务 要 求 编写 各 类 告警 规则 ， 输 出 报警 数据 。 

图 6 中间 一 级 抓 取 层 和 最 下 面 二 级 抓 取 层 主要 是 
收集 服务 器 主机 的 基础 数据 、 基 础 组 件数 据 和 所 监控 
应 用 的 服务 数据 等 ， 将 所 收集 到 的 数据 进行 标准 化 ， 
提供 给 Prometheus 的 服务 采集 接口 。 具 体 为 : 

一 级 抓 取 层 。 负 责 拉 取 对 应 区 域 所 有 二 级 抓 取 机 
中 抓 取 到 的 指标 数据 ， 并 将 这 些 数据 存储 到 核心 服务 
器 的 时 序数 据 库 中 。 一 级 抓 取 会 将 指标 数据 同时 推送 
到 总 社 的 核心 服务 器 上 进行 存储 ， 保 证 数据 可 用 性 。 
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相应 的 Json 文件 或 者 模块 编号 , 将 其 导入 Grafana 中 。 

综合 分 析 业 务 展示 方式 和 展示 效果 ， 选 取 所 需要 
的 各 类 数据 ， 包 括 基础 数据 和 应 用 服务 指标 数据 ， 将 
其 展示 到 Grafana 的 Web 界面 中 。 
5.4.3 告警 规则 配置 过 程 

Grafana 的 告警 触发 以 panel 为 基础 ， 即 每 个 panel 
单独 配置 告警 信息 ， 包 括 告警 规则 、 和 触发 条 件 、 告 警 
通知 通道 及 内 容 。 

指定 所 需要 修配 配置 的 通道 ， 修 改 Grafana 配置 
文件 ( grafana.ini ) 。 

登录 Grafana Web 服务 界面 ， 进 入 设置 区 ， 接 收 
告警 的 通道 ， 并 配置 相应 的 国 值 。 
6. 整体 界面 效果 

根据 配置 的 Granfa 服务 地 址 和 端口 ， 登 录 Grafana 
Web 服务 ， 配 置 连接 对 应 的 时 序数 据 库 ， 将 收集 到 的 


格式 化 数据 统一 展示 在 运 维 监控 大 屏 之 中 ， 巧 妙 选择 


二 级 抓 取 层 ， 负 责 抓 取 所 管辖 服务 站 点 内 的 指标 
数据 。 有 具体 抓 取 的 数据 有 : 抓 取 所 有 站 点 物理 机 和 虚 
拟 机 的 系统 数据 及 基础 组 件 的 指标 数据 ; 全 媒 平 台所 
涉及 的 4 个 站 点 的 重要 应 用 服务 接口 的 指标 数据 ， 所 
获取 的 指标 数据 需 足 以 保证 足以 覆盖 业务 服务 状态 的 
安全 、 可 靠 和 稳定 。 

5.4 ”环境 搭建 实现 过 程 
5.4.1 数据 收集 配置 过 程 

在 4 个 站 点 和 总 社 汇总 点 ， 搭 建 统一 运 维 监控 集 
群 服务 。 分 为 总 社 汇总 、 一 级 抓 取 和 二 级 抓 取 。 

在 各 个 站 点 安装 exporter， 实 现 基 础 数据 的 采集 。 
主要 指标 数据 分 为 CPU、 内存、 文件 系统 、 磁 盘 、 网 络 、 
TCP 连接 数 等 方面 。 包 括 CPU 各 模式 秒 数 、5 分 钟 平 
均 负 载 、 内 存 总 /空闲 /可 用 字 节 数 、 文 件 系统 总 /可 
用 字 节 数 、mysql、mongoDB 、Nginx 、es 、redis 等 多 项 
关键 指标 。 

在 各 个 站 点 部 署 应 用 的 指标 采集 程序 ， 安 装 白 盒 
黑 盒 探 针 及 日 志 分 析 服 务 等 ， 转 化 为 Prometheus 可 以 
识别 可 以 支持 的 数据 格式 ， 转 换 为 上 一 级 可 以 提取 的 
数据 格式 。 

5.4.2 数据 展示 配置 过 程 

登录 总 社 服务 器 ， 安 装 Grafana。( 如 果 查 看 
各 个 站 点 收集 数据 的 展示 情况 ， 也 可 在 分 站 点 安装 
Grafana ) 。 

通过 Web 服务 连接 Grafana， 使 用 管理 员 账 户 登 
录 Grafana， 配 置 连接 的 时 序数 据 库 数据 源 。 

选用 合适 的 展示 模块 ， 如 当前 没有 ， 从 官网 获取 


不 同 的 显示 颜色 和 不 同 的 展示 方式 ， 将 数据 平面 化 、 
图 形 化 、 易 读 化 ， 便 于 运 维 值班 人 员 随 时 查看 了 解 系 
统 赖 以 运行 的 基础 环境 和 网 络 的 实时 工作 人 情况， 第 一 
时 间 获 取 系统 运行 的 状态 信息 和 报警 信息 。 

6.1 全 媒 平台 监控 概览 


图 7 展示 了 全 媒 平 台 业 务 、 端 口 、 接 口 和 进程 的 
总 体 情 况 , 如 某 个 模块 颜色 变 红 , 则 说 明 存 在 报警 情况 ， 
将 鼠标 放置 在 某 一 面板 左上 的 超 链接 图 标 上 ， 即 显示 
下 钻 详 情 的 超 链 接 ， 点 击 可 进入 相应 的 二 级 监控 页 查 
看 详情 。 左 下 部 分 为 新 供稿 2.0 四 个 站 点 的 拨 测 详情 。 
如 某 个 模块 颜色 变 红 ， 则 说 明 存 在 报警 情况 ， 点 击 相 
应 模块 可 进入 二 级 监控 页 查看 详情 。 
6.2 全 媒 平台 二 级 监控 细 览 

图 8 和 图 9 展示 了 业务 系统 中 涉及 的 进程 服务 状 
态 和 端口 服务 状态 ， 图 10 和 图 11 展示 了 业务 系统 中 
部 署 的 基础 环境 和 网 络 环境 的 整体 情况 ， 下 图 的 颜色 
会 变 成 黄色 或 者 红色 等 不 同 颜色 状态 信息 ， 以 方便 运 
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图 8 全 媒 平台 二 级 拨 测 详情 


维 人 员 通 过 颜色 及 时 获知 系统 的 运行 情况 。 


图 9 全 媒 平台 二 级 端口 服务 详情 


图 10 ”全 媒 平台 CPU/ 内 存 情况 


图 11 全 媒 平台 网 络 基础 环境 情况 


结语 

简单 而 又 直观 的 监控 信息 展示 ， 是 系统 运 维 的 利 
器 ， 正 确 而 又 及 时 地 监控 报警 是 服务 稳定 的 基础 。 随 
着 微服 务 架构 设计 理念 应 用 到 全 媒 平 台 的 实际 生产 应 
用 中 , 开源 的 Prometheus+Grafana 天 然 组合 , 因 其 简单 、 
稳定 、 可 靠 和 易 扩 展 等 特点 ， 成 为 搭建 企业 级 运 维 监 
控 平台 的 首选 环节 。 笔 者 在 本 文中 所 阐述 的 设计 方案 
和 实施 细节 ， 有 效 助 力 了 全 媒 平台 运 维 人 员 的 运 维 效 
率 和 运 维 能 力 ， 从 而 进一步 保障 了 系统 的 稳定 可 靠 运 


行 ， 成 为 当前 系统 运 维 不 可 或 缺 的 组 成 部 分 。 唤 
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